A200 产品规格书
Copyright
本文件为知合计算技术(上海)有限公司(以下简称“--公司--”)的财产,未经公司同意或书面同意,不得向任何第三方披露、给予或转让。如违反本条规定,给公司造成损失的,应当承担赔偿责任。
Contacts
知合计算技术(上海)有限公司
地址: 上海市浦东新区申江路 5005 弄星创科技广场 3 号楼 12F
邮箱: business@zhcomputing.com
电话: 0571-87208790
简介
A200 是一款低功耗、高性能、高安全、多模态感知和多媒体 AP 能力的 AI 处理器芯片,可用于刷脸支付终端、AI边缘计算、视频会议一体机、人脸识别考勤门禁、带屏智能音箱等应用场景。基于多核异构架构,集成 RISC-V指令架构的四核 C910 和单核 C906 处理器。
内嵌多个强大硬件加速引擎,提供性能优化的高端应用。支持 H.265/H.264/VP9 标准视频编码,最高分辨率达 4K@60fps,支持H.265/H.264/VP9/AVS2 等多格式视频解码,最高分辨率达 4K@120fps,支持 JPEG 编解码,最高分辨率达 32Kx32K。
内嵌 3D GPU 完全兼容 OpenGL ES3.0/3.1/3.2,OpenCL 1.1/1.2/2.0 和 Vulkan 1.1/1.2,支持 2D 加速引擎,以及通用 DSP 加速器。
支持双通道外部存储器接口,支持 LPDDR4/LPDDR4X ,提供最大存储带宽达 34GB/s,同时提供满足多变应用的外设接口。
功能特性
高性能处理器核
-
四核 RISC-V 64GCV 指令集架构 C910,最高主频可达 2GHz
-
支持小端模式
-
9~12 级深流水架构
-
3 发射 8 执行的超标量架构,对软件完全透明
-
按序取指,乱序发射,乱序完成和按序退休
-
两级高缓结构,哈佛结构一级高缓和共享的二级高缓
-
一级缓存支持 MESI 的一致性协议,二级缓存支持 MOESI 的一致性协议
-
每核支持 64KB I cache 和 64KB D Cache
-
四核共享 1MB L2 Cache
-
支持私有中断控制器 CLINT 和公有中断控制器 PLIC
-
两级 TLB 内存管理单元,实现虚实地址转换与内存管理
-
指令高缓路预测的低功耗访问技术
-
短循环缓存的低功耗执行技术
-
支持 segment load、store 指令
-
支持计时器功能
-
支持 TEE 和 REE,TEE/REE 支持核数启动时可配置
-
支持 Linux 和 Android
-
支持自定义且接口兼容 RISC-V 的多核调试框架
-
独立电源域,支持 DVFS
AI 计算引擎
-
支持 4TOPS@INT8 通用 NNA 算力,主频 1GHz
-
支持 INT8, INT16
-
支持 TensorFlow,ONNX,Caffe
-
支持 CNN,DNN 等
-
支持卷积、激活、单元操作(加法、乘法、最大值、最小值)、池化(最小值、最大值、平均值)、归一化、反卷积
-
无损权重数据压缩
-
灵活比特深度支持:灵活的输入输出和中间数据位深度,8~16 位
-
带宽缩减:
-
支持权重压缩,最小化 DDR 带宽需求,降低功耗
-
支持片上缓存,存储网络中间层数据,减小网络运行对 DDR 带宽需求
-
存储接口
-
片内存储
-
片内 SRAM:128KB
-
片内共享 SRAM:1.5 MB
-
-
片外存储
-
LPDDR4/LPDDR4X
-
支持 32/64 位 LPDDR4/LPDDR4X,最高速率 4266Mbps
-
兼容 JEDEC 标准LPDDR4-2133/LPDDR4-3200/LPDDR4-3733/LPDDR4-4266/LPDDR4X-2133/LPDDR4X-3200/LPDDR4X-3733/LPDDR4X-4266 SDRAM
-
支持 2 个通道,每个通道 32 位数据位宽
-
最大 16GB 地址空间
-
32 位和 64 位软件可配置
-
支持不同 LPDDR4/4X 颗粒时序参数可配置
-
命令重排序和调度,最大化带宽利用率
-
ODT 电阻可编程,动态 PVT 补偿
-
-
SPI NOR/NAND Flash 接口
-
支持 2 路 QSPI,1 路 SPI
-
QSPI0 最高 100MHz,QSPI1 和 SPI 最高 66MHz
-
支持 1 位/2 位/4 位数据线模式传输
-
2 个 QSPI 接口,可配置为 Mode0/Mode1/Mode2/Mode3
-
-
eMMC5.1 接口,最高速率支持 HS400
-
兼容 JEDEC 标准 eMMC5.1 和 eMMC5.0
-
支持 HS400,HS200,DDR52 模式
-
支持 eMMC 启动
-
在 8 位数据线模式下:
-
HS400 模式(200MHz DDR),理论最高数据率可达 400MB/s
-
HS200 模式(200MHz SDR),最高数据率 200MB/s
-
DDR52 模式(52MHz DDR),最高数据率 104MB/s
-
-
支持 1 位/4 位/8 位数据线模式传输
-
-
SD3.0 接口
-
兼容 SD3.0
-
1 个 SD 接口,可配置为 SD/MMC/SDIO
-
最高数据传输带宽 100MB/s
-
支持1 位/4 位数据线传输模式
-
-
图像处理单元
-
支持APIs:
-
支持Vulkan1.1/1.2
-
支持OpenCL1.1/1.2/2.0
-
支持OpenGLES3.0/3.1/3.2
-
-
基于分片的 3D 图形渲染,支持多个分片同时处理
-
可编程的高质量抗混叠
-
支持和 NNA 的 AI 协同
-
先进的 DMA 操作,降低主 CPU 负载
-
压缩纹理编码
-
无损数据压缩
-
固件执行专用处理器
-
性能
-
支持3D 图形加速引擎,3200Mpixel/sec@800MHz
-
F32 操作,每个时钟周期 64 次
-
F16 操作,每个时钟周期 128 次
-
整数操作,每个时钟周期 32 次
-
几何操作,每 4 个时钟周期 1 次三角形操作
-
二维图像加速器
-
输入与输出
-
支持 8/10 位 YUV 4:2:2/YUV 4:2:0 输入输出 格式
-
支持 RGB444/RGB565/RGB888/RGB101010 输入输出格式
-
支持 ARGB4444/ARGB1555/ARGB8888/ARGB2101010 输入输出格式
-
输入输出数据存储格式与 ISP/VENC/VDEC/NPU/DPU/GPU 等适配
-
-
2D操作
-
bitBlit
-
stretchBlit
-
rect fill & clear
-
filterblit
-
Alpha Blending
-
90/180/270 rotation
-
scale/crop
-
line
-
RGB2YUV
-
YUV2RGB
-
-
Multi-src blit
-
支持不同尺寸 rect 多源混叠
-
支持最多 8 个源
-
支持每个源设置单独的旋转参数
-
支持每个源设置单独的缩放参数
-
数字信号处理器
-
支持 2 路独立 DSP 核,主频 1GHz
-
支持 256 个 8x8 MAC
-
支持 16 个单精度 VFPU
-
支持图像直方图统计
-
32KB 指令 Cache
-
2 个 128KB 数据 RAM
-
操作类型
-
加载和存储
-
乘法运算
-
除法运算
-
矢量压缩和扩展
-
算术运算
-
位逻辑运算
-
位操作
-
比较运算
-
移 位作业
-
旋转操作
-
递减操作
-
打包操作
-
选择和双重选择操作
-
随机混合操作
-
移动操作
-
系统组件
-
CRU
-
支持外部晶振 24MHz 输入、外部晶振 32.768KHz 输入、内置 24MHz~26MHz RC
-
支持时钟分频、时钟切换、时钟门控
-
支持上电复位
-
支持外部复位
-
支持看门狗复位
-
支持全局软复位和模块软复位
-
-
PMU
-
支持正常运行模式,空闲模式,HW-VAD 模式,休眠模式
-
支持时钟门控和电源关断
-
支持唤醒源:HW-VAD,RTC and GPIO(键盘,wifi…)
-
支持 4 个独立电源域,可以从外部用 PMIC 关断
-
芯片内部做了隔离保护,以支持电源开关
-
-
中断
-
芯片中集成的每个 CPU 核内部都带有各自的中断控制器
-
E902/C906 CPU 中集成的是与 RISC-V 标准兼容的核内局部中断控制器:CLIC
-
C910 中集成的是与RIISC-V 标准兼容的平台级别中断控制器:PLIC
-
所有中断使用电平触发的方式,高电平有效
-
-
DMAC
-
独立的核、从接口和主接口时钟
-
可以配置 4 个通道,每个通道是一个源和目标对
-
通道优先级可编程
-
DMA 数据传输有四种:内存到内存、内存到外设、外设到内存和外设到外设
-
可编程多块传输,通过链表、连续地址、自动重载和影子寄存器等方式
-
中断触发源包括:
-
DMA 传输完成
-
块传输完成
-
单个或多个事务完成
-
出错
-
通道挂起或禁用
-
-
支持中断使能和屏蔽
-
-
安全引擎
-
TEE+REE 两层安全体系架构
-
硬件随机数发生器
-
基于硬件的隔离机制
-
支持安全启动
-
内置 Sensor 为安全电路提供物理防护
-
支持 ID2 安全芯片能力
-
-
核间通讯
-
支持软件控制的单发单收、多发单收、单发多收、多发多收的多核通信
-
支持发送 CPU 向接收 CPU 传递除中断事件外的信息量,以信息寄存器组的方式体现
-
支持软件查询中断状态,即软件查询当前通信状态
-
支持软件屏蔽中断产生,即软件切断该通信通道
-
支持软件清除中断状态(结束一次通信的必备条件)
-
支持发送方 CPU 传递的信息量(32bit 寄存器个数)为 8
-
视频编解码器
-
视频解码器
-
实时解码器,支持 H.265/H.264/VP9/8/7/6/AVS/AVS+/AVS2.0/VC1/MPEG4
-
支持 H.264 BP/MP/HP@level5.1 解码,最大 4K 分辨率
-
支持 H.265/HEVC Main Profile@level5.1 解码,最大 4K 分辨率
-
支持 VP9 Profile-2 解码,最大 4K 分辨率
-
支持 AVS2.0 解码,最大 4K 分辨率
-
支持 VP6/7/8/AVS/AVS+/VC1/MPEG4 解码,最大 1920x1080 分辨率
-
解码性能最大 4K@120fps
-
-
视频编码器
-
支持 H.264BP/MP/HP@level4.2 编码,最大 4K 分辨率
-
支持 H.265/HEVCMain Profile 编码,最大 4K 分辨率
-
仅支持 I 帧和 P 帧
-
编码性能最大 4K@60fps
-
支持多路编码和多路解码
-
支持编解码同时进行
-
-
JPEG 视频编解码
-
支持 MJPEG/JPEG Baseline 编解码
-
最大支持 32Kx32K JPEG 解码
-
最大支持 16Kx16K JPEG 编码
-
视频接口
-
视频输入接口
-
2 路 2-lanes MIPI CSI-2 输入,每 lane 支持 2.5Gbit/s
-
2 路 2-lanes MIPI CSI-2 可以拼接成 1 路 4-lanes MIPI CSI-2
-
2 路 MIPI 输入可以映射到 2 个 ISP 上或 DMA 上
-
支持 RAW8,RAW10,RAW12 输入格式
-
2-lanes MIPI CSI 支持最大 8MP sensor 输入
-
支持对 单曝光 sensor 的低成本 HDR 算法处理
-
-
视频输出接口
-
16-/24-bit RGB 数字接口输出,最高支持 1080p@30fps
-
2路 4-lanes MIPI DSI 输出,每 lane 支持 2.5Gbit/s HDMI 接口,最高支持 4K@60fps
-
支持 HDMI 2.0,向后兼容 HDMI 1.4
-
最高支持 1080p@120fps,或者 4Kx2K@60fps
-
输入参考时钟 13.5MHz 到 600MHz
-
最高总带宽 18Gbps
-
支持 8 声道音频输出
-
支持 CEC(ConsumerElectronicsControl)
-
支持 HPD(HotPlugDetection)
-
-
图像信号处理器
-
支持两路独立 ISP 处理
-
支持 RAW 8~16 位输入,支持 IR 10 位/YUV420 8 位/RGB888 输出
-
支持 RGB Bayer/RGB IR pattern 4x4 输入处理
-
支持最高 13M 像素输入(12M 像素处理)
-
支持 LSC 和 DPC
-
支持 3A(AE/AWB/AF) 算法
-
支持 2D/3D 图像降噪和图像锐化
-
支持颜色增强,高亮抑制,背光补偿,伽马校正等
-
支持抗闪烁
-
支持鱼眼校正
-
支持 HDR 和 WDR
显示处理单元
-
支持双路视频显示,分辨率可达 4K@60fps + 1080p@60fps
-
两路显示共支持 6 层叠加,两路显示层数可灵活配置
-
支持旋转和缩放
-
视频时序产生
-
HSYNC/VSYNC/DE 信号
-
可编程计数器
-
-
显示接口
-
30 位 DATA 和 HSYNC/VSYNC/DE 并行像素输出
-
DPI 24/18/16位
-
R10G10B10 30 位输出
-
-
显示
-
最大显示尺寸:4Kx2K
-
每个显示独立的同步和场消隐信号
-
每个显示独立的伽马和抖动
-
-
输入格式
-
ARGB2101010,A/XRGB8888,A/XRGB1555,RGB565,A/XRGB4444
-
YUV422,YUV420
-
-
格式转换
-
可从多个 RGB/YUV 格式输入像素
-
颜色空间转换 BT.2020 和 BT.709
-
24 位多格式 RGB 像素输出
-
-
输出格式
- RGB101010/DPI_D16CFG1/DPI_D16CFG2/DPI_D16CFG3/DPI_D18CFG1/DPI_D18CFG2/DPI_D24/DPI_D30
-
硬件光标
- 支持 ARGB888 和屏蔽光标
-
颜色
-
独立的抖动查找表
-
独立的伽马校正查找表
-
坐标生成叠加
-
Alpha 混叠:波特-达夫混叠模式
-
-
滤波和缩放
-
垂直和水平缩放
-
可编程滤波
-
音频处理器
-
C906 单核处理器,主频最高 800MHz
-
RV64IMA[FD]C[V] 指令架构
-
5 级单发按序执行流水线
-
一级哈佛结构的指令和数据缓存,大小为 32KB,缓存行为 64B
-
Sv39 内存管理单元,实现虚实地址转换与内存管理
-
支持 AXI4.0 128 位 Master 接口
-
支持核内中断 CLINT 和中断控制器 PLIC
-
可配置的浮点单元和矢量单元
-
SIMD128 处理单元
-
矢量计算单元的主要特征点如下:
-
遵循 RISC- V V 矢量扩展标准(revision 0.7.1)
-
算力可达 4GFlops(@1GHz)
-
支持配置矢量执行单元
-
支持 INT8/INT16/INT32/FP16/FP32 矢量运算
-
支持 segment load、store 指令
-
音频接口
-
支持 1 个 8 通道(4 个 RX 左右声道或者 4 个 TX 左右声道)I2S 接外部 CODEC 音频输入,最高 384kHz
-
支持 3 个 2 通道 I2S/PCM 接外部 CODEC 播放/录音(16k/32k/48k/44.1k/64k/192k/384kHz) 或蓝牙语音连接 (8k/16k/32k/48k/44.1kHz)
-
支持低功耗 VAD(仅 RX),最大支持 8 通道(4 个 RX 左右声道) I2S
-
支持 8 路(4 个 RX 左右声道) PDM 数据对接外部 DMIC
-
支持 8 路 TDM/PCM 输入
-
支持 2 个 SPDF-IN/OUT,支持采样率 32/44.1/48/88.2/96/192kHz
外设接口
-
GMAC
-
支持 2 路千兆以太网
-
支持 10/100/1000Mbps 数据传输率 RGMII/RMII 接口
-
支持全双工和半双工模式
-
-
USB
-
支持一路 USB3.0 DRD,可作为主机或设备,兼容 USB2.0
-
USB3.0 特性
-
支持 PIPE3 接口
-
5Gbps 数据传输速率
-
自适应接收均衡
-
-
USB2.0 特性
-
支持 UTMI+ 接口
-
高速 480Mbps
-
全速 12Mbps
-
低速 1.5Mbps(仅主机模式)
-
-
-
UART
-
支持 8 路 UART
-
1 路带流控 UART,最高速率 4Mbps
-
3 路支持红外 UART
-
-
I2C
-
支持 7 位/10 位地址模式
-
支持 9 路 I2C,最高速率 1.7Mbps
-
-
ISO7816
- 支持 1 路 ISO7816
-
GPIO
-
支持 145 个 GPIO
-
支持中断
-
-
定时器
-
多达 4 个定时器单元
-
通过配置相关的 sysreg 寄存器,4 个计数器可以成对级联
-
每个定时器可配置定时器宽度:32 位
-
可配置计数器级联 ,最大计数位宽可达 128 位
-
支持自由运行和用户自定义计数两种操作模式
-
-
PWM
-
支持 1 路 6 通道 PWM,最高频率 12MHz
-
占空比可配置
-
支持单次模式和连续模式
-
支持单次模式下的事件触发模式
-
-
看门狗
-
可配置 WDT 计数器宽度为 32 位
-
计数器从预设值递减计数到 0,表示发生超时
-
可选的外部时钟使能信号来控制计数器的计数速率
-
如果发生超时,看门狗可以执行如下的一个操作:
-
生成系统复位
-
首先产生一个中断,如果在第二个超时发生时服务程序没有清除该中断,则产生一个系统复位
-
-
其他
-
EFUSE
-
8Kbit 容量
-
编程时间: 5 μs±10%
-
系统框图
